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Ідентифікація функції оцінки об'єкта 
нерухомості нейронною мережею 


У статті викладено аспекти визначення ціни об'єкта нерухомості з використанням модифікованого 
алгоритму стохастичної релаксації. Запропонований метод ідентифікації функції оцінки об'єкта нерухомості 
впроваджено в інформаційно-аналітичній системі «ЕЕМА». Виконано верифікацію отриманих результатів з 
використанням штучних нейронних мереж. 


Вступ 


Інтерес до нейромережних технологій, який виявляють фахівці з різних сфер діяль- 
ності, пояснюється, насамперед, дуже широким діапазоном розв'язуваних з їхньою 
допомогою задач, а також перевагами перед іншими методами. 

Аналіз робіт, пов'язаних із використанням нейронних мереж для аналізу ринку 
нерухомості, а саме: розв'язання задач класифікації, ідентифікації, прогнозування та 
розпізнавання образів, показує, що нейромережний підхід має переваги перед тради- 
ційними математичними методами в трьох випадках. По-перше, коли задача, що 
розглядається, через конкретні особливості предметного середовища не може бути 
адекватно формалізована, оскільки містить елементи невизначеності, які не формалі- 
зуються з використанням традиційних математичних понять. По-друге, якщо задачу 
можна формалізувати, але на даний час апарат для її розв'язання відсутній. По-третє, 
коли для формалізованої задачі існує відповідний математичний апарат, але реаліза- 
ція обчислень з його допомогою на базі наявних обчислювальних систем не задовольняє 
вимогам одержання розв'язку за критеріями часу та іншими. У такій ситуації дово- 
диться робити спрощення алгоритмів, що знижує якість рішень, або застосовувати 
відповідний нейромережний підхід за умови, що він забезпечить потрібну якість 
виконання задачі. 


Постановка задачі дослідження 


Необхідність врахування значної кількості екзогенних факторів вимагає достат- 
ньої кількості навчальних образів. Багатофакторність задачі і, як наслідок, рельєфність 
функції помилки вказують на наявність локальних мінімумів і високої ймовірності 
влучення в них. Існує також небезпека паралічу мережі | 1. 

Уникнути проблем, пов'язаних із навчанням нейронної мережі НМ, дозволяє 
процедура навчання Больцмана | 11, (21. Її головна ідея полягає у використанні прин- 
ципу віджигу металу. Якщо метал нагріти до температури, яка перевищує його точку 
плавлення, то атоми знаходяться у стані невпорядкованого руху. При охолодженні 
вони прагнуть до стану, який відповідає мінімуму енергії. Ймовірність того, що 
система знаходиться у стані з енергією е, визначається розподілом Больцмана 
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е йо З ; 
Р(е) з ехр| - - - |, де Кк - постійна Больцмана, Т - температура. Головний висновок із 
КТ 


цієї формули полягає в тому, що високоенергетичні та низькоенергетичні стани май- 
же рівноймовірні. При високих температурах ймовірність прагне до одиниці незалежно 
від енергетичного стану. При наближенні температури до нуля ймовірність високо- 
енергетичного стану є близькою до нуля. Ці принципи і покладені в основу стохас- 
тичної релаксації НМ. 

Модифікований алгоритм методу стохастичної релаксації (МАСР) |З3| є таким: 
Крок 1. Задати початкове, заздалегідь велике значення температури Т 1 точність ре- 
зультату є. 

Крок 2. Згенерувати рівномірно розподілені на інтервалі (0, 1) матриці значень ваго- 


вих коефіцієнтів Й « (и/,, р ді» 


И «(ура Нехай і-І,роі, д-і1. 
Крок 3. Подати на вхід мережі і-й навчальний образ і всі контрольні образи та обчис- 
лити значення функції енергії Е, 1 Е,, відповідно. 
Крок 4. Змінити значення вагового коефіцієнта у», є Й/ на рівномірно розподілену в 
(0, 1) величину Ди», - 
Крок 5. Подати на вхід мережі і-й навчальний і всі контрольні образи та обчислити 
значення функції енергії Б і Е,. 

5.1. Якщо Б «Кі Е, «Е,, то зміну вагового коефіцієнта зберегти. 

5.2. Якщо ЕК» Бі Е»Е,, то зміну скасувати. 

5.3. Якщо БЕ » Бі Е, ХЕ, то генеруємо рівномірно розподілене на (0,1) ви- 

«ої . - - -1 

падкове число і та знаходимо БЕ, (Лу,,,). При виконанні нерівності 2 » Б, (Ли»,,) 
зміну вагового коефіцієнта зберігаємо, у протилежному випадку значення вагового 
коефіцієнта залишаємо незмінним. 

54. Якщо КБ «КЕ їі Ко» Е,, то процедура зміни значення вагового коефі- 


- - - --Ї 
цієнта аналогічна п. 5.3, лише використовується функція Б, (Лм»,,). 


Крок 6. Якщо подані всі навчальні образи, то розрахувати значення цільової функції 
Е навсіх навчальних і контрольних образах. Якщо Е « є, то перейти на крок 9. 
Крок 7. Якщо здійснено перебір усіх вагових коефіцієнтів із матриць Й 1 У, змен- 
шити значення температури, і - 1-- 1. Перейти на крок 3. 

Крок 8. В якості у, взяти наступний ваговий коефіцієнт із Й або ИЙ і перейти на 


крок 4. 
Крок 9. Кінець. 

Запропонований алгоритм майже унеможливлює виникнення традиційних для 
НМ із градієнтними методами навчання проблем із влученням у локальні мінімуми 
функції енергії 1 «паралічем» мережі. Відмінністю запропонованого методу від 
класичного навчання Больцмана є використання принципу регуляризації | 41, відпо- 
відно до якого всі дані (крім перевірочної послідовності) певним чином поділяються 
на дві послідовності: навчальну і контрольну. 

Отже, необхідно впровадити розроблений алгоритм в інформаційно-аналітичну 
систему 1 дослідити ефективність його використання для визначення функції оцінки 
об'єкта нерухомості (ОН). 
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Ідентифікація функції оцінки об'єкта нерухомості 
нейронною мережею із модифікованим алгоритмом 
стохастичної релаксації 


Визначення функції оцінки ОН будемо виконувати за допомогою інформа- 
ційно-аналітичної системи ТАС ВЕМА (Веаі Екїаїє Мапаєетепі Апаїузі8) (5|. Для 
розв'язання задачі ідентифікації функції ціни ОН в ТАС КЕМА передбачено два 
режими роботи: з ручним та автоматичним вибором параметрів. Базовою моделлю є 
НМ із прямозв'язним функціонуванням. Структура НМ визначається кількістю входів, 
виходів, прихованих шарів, нейронів у прихованих шарах. Якщо кількість входів та 
виходів однозначно визначається формалізованою постановкою задачі, то вибір 
параметрів прихованих шарів залишається досі не вирішеною проблемою. Існують 
лише певні оцінки, які звужують коло пошуку, але однозначної відповіді не дають. 

При автоматичному виборі параметрів використані такі міркування. Оскільки у 
відомій теоремі Колмогорова |6) встановлено, що функція К-змінних може бути 
представлена як суперпозиція 2К -- | одновимірних функцій, то недоцільно вибирати 
кількість нейронів прихованого шару більшою ніж подвоєне число вхідних факторів, 
тобто 14 р «Зп, 4-1. З іншого боку, показано |7), що, припускаючи границі помилки 


Г0, 1/8), кількість навчальних образів повинна бути приблизно рівною кількості ваго- 


о М 
вих коефіцієнтів НМ, помножена на обернену величину помилки, тобто т 2 --. Тоді 
є 


загальна кількість вагових коефіцієнтів М - р'п,,,, де п,,, - сумарна кількість вхо- 
«М «(Зп 


кількості нейронів прихованого шару є таким: 


хву 


дів і виходів НМ і п -Т)п Результуючий вираз для обчислення 


хну хну хну 


рей, З НВ (п, яп, 1. (1) 
хау 
Для 500 навчальних образів, точності результату 0,1, 4-х входів та 1-му виходу 
максимальна кількість нейронів прихованого шару становить 9. Всі вищенаведені 
висновки, припущення та результати одержані без врахування того факту, що ап- 
роксимуючі функції, які використовуються як активаційні у нейронах НМ є різними 
залежно від задачі та типу і нормування початкових даних. 

Визначення оптимальної кількості нейронів прихованого шару здійснимо експе- 
риментально за допомогою ТАС ВЕМА. Використаємо процедуру «ручного» вибору 
початкових значень параметрів НМ та алгоритму її навчання. Нехай: 

- кількість нейронів прихованого шару - від 3 до 100; 

- вхідних нейронів - 4; 

- вихідних нейронів - 1; 

- значення середньої абсолютної помилки для навчальної нормованої послідовності - 
від 2 до 0,15; 

- точок навчальної послідовності - 39. 

Результати роботи ТАС наведені на рис. І та в табл. І (е - середня абсолютна 
помилка, п - кількість нейронів прихованого шару). Їх аналіз показує, що міні- 
мальним є середнє абсолютне відхилення на контрольній послідовності, одержане 
при мінімальному значенні середнього абсолютного відхилення на точках навчаль- 
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ної послідовності, що є очікуваним. Разом із тим встановлено, що оптимальною є 
кількість нейронів прихованого шару від 6 до 10, що суперечить лише (1). 


Кількість ітераці 


Кількість нейронів прихованого шару 


-9-ес:2-1Ю-о-і е-0,5 (" е-0,2-Ж-е-0,15 


Рисунок 1 - Результати експерименту 


Таким чином, одержані результати свідчать про необхідність перенавчання НМ 
у випадку збільшення кількості точок навчальної послідовності на декілька відсотків 
(4 - 8 У0). Виконувати цю процедуру раціонально щомісячно. 


Таблиця 1 - Кількість ітерацій алгоритму МАСР 


еп 3 4 5 6 10 20 50 100 
2507 | 9666 | 10981 9162 16998 16471 17002 17144 
1 8382 | 8022 8584 8501 7652 8551 8262 8300 
0,5 | 4253 | 4294 4204 4211 4120 397 4273 3985 
02 1522 1500 1538 1502 ПОЗУ 132 1485 1594 
0,15 | 1091 1174 1152 1189 1159 1057 1226 1108 


Для того щоб переконатись у ефективності роботи МАСР (з використанням 
ІАС ВЕМА), виконаємо експериментальну перевірку та порівняння результатів роботи 
НМ із алгоритмами Левенберга-Маркарта (АЛМ), алгоритмом оберненого поширен- 
ня похибки із оптимізацією вагових коефіцієнтів методом Флетчера-Пауела (АФП), 
алгоритмом спряжених градієнтів (АСГ) (з використанням пакету Майаб). Оскільки 
кожний із цих алгоритмів реалізує прямозв'язна НМ, то параметри структури задані 
однаково. Початковими даними є вибірка ОН, яка використовувалась у попередній про- 
цедурі. В якості критеріїв вибрано: 

- час навчання НМ (при однаковому значенні середнього абсолютного відхилення 
на точках навчальної послідовності); 

- величина середнього абсолютного відхилення точних значень результуючого по- 
казника від розрахованих НМ на точках контрольної послідовності (при фіксованому 
значенні такої ж величини на точках навчальної послідовності); 

- величина середнього абсолютного відхилення точних значень результуючого показ- 
ника від розрахованих НМ на точках контрольної послідовності (при фіксованому 
значенні часу навчання НМ). 

Результати експерименту наведені в табл. 2. Для їх верифікації розглядались 
три вибірки із генеральної сукупності. У першій вибірці відношення навчальних об- 
разів до контрольних становило 80:20, у другій - 70:30, у третій - 60:40. Для роз- 
рахунку значення другого критерію К2 значення середнього абсолютного відхилення 
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на точках (нормованих) навчальної послідовності встановлено рівним 0,3. Знаходження 
значення КЗ відбувалось при значенні середнього абсолютного відхилення на точках 
навчальної послідовності 0,0001, що апріорі вимагало додаткових перетворень для 
досягнення такої точності на фіксованому часі навчання, рівному одній хвилині. 


Таблиця 2 - Дані результатів експерименту 


Номер Критерії 
вибірки -НМ КІ К2 КО 
МАСР 62 68 128 
і АЛМ З1 251 278 
АФП 27 208 245 
АСГ 38 284 259 
МАСР 61 82 135 
2 АЛМ 27 305 288 
АФП 26 296 270 
АСГ 39 310 213 
МАСР 56 128 138 
3 АЛМ 26 331 306 
АФП 20 329 305 
АСГ ЗІ 362 338 
Ціни х 10 
1900 А 
| АР 
й й : 1 51 
150 і; й Р А У У б 
130 / и ні й й ' и ре і | о 
ДО А РК А 
по РА РО РОЇ 
7 РО ЗАД фо чн М 
і; | Й 1 У 
70 У Я, 2/2 ро 
єї їй. Х 
50 і 
12 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 
Номер ОН 
777-ЧЦіна 7777МНКИ4) 7277МНКИ) 777 Брандон 


Рисунок 2 - Реальна ціна 1 ціна, розрахована з використанням нейромережної 
ідентифікації 


Під час навчання НМ, в яких використовувалось обчислення градієнта, досить 
часто спостерігалось явище паралічу мережі, що пояснюється великою кількістю 
однакових значень факторів. Наслідком цього є нульове значення градієнта та від- 
сутність динаміки навчання НМ. Так, при 50 запусках одного із представників БасК 
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ргорагайоп - алгоритму Левенберга-Маркуарда 28 раз процес навчання переривався 
штучно через параліч мережі, 16 раз точність була низькою через попадання в локальні 
мінімуми 1 лише 6 раз точність порівнянна із точністю результатів нашого методу. 

Аналіз результатів експериментів показує, що алгоритм МАСР в середньому 
удвічі повільніше працює за інші алгоритми з градієнтними методами навчання. 
В той же час його результати є значно точнішими (на 80 - 130 Уб) як за результати 
роботи НМ з іншими алгоритмами, так 1 за результати (800 -- 1000 9), що одержані 
внаслідок використання класичних інтегро-диференціальних методів. При зроблених 
попередніх припущеннях середня похибка для МАСР становить 0,05 - 0,98 90, для 
АЛМ - 2,88 - 3,3 Ус, для АФП - 2,22 - 2,79 Зо, для АСГ - 3 - 3,39 9», що переконує в 
ефективності першого алгоритму (рис. 2). 

Було проведене також додаткове дослідження графіка залежності середнього 
квадратичного відхилення від кількості ітерацій | 8| (рис. 3). Встановлено, що досить 
велике значення середньої абсолютної похибки (Еттог - 2, Нттог - 1,5, Нтгог - 1) на точ- 
ках контрольної послідовності зумовлює досить гладке зменшення середньої абсолютної 
похибки на точках контрольної послідовності. При зменшенні значення похибки на 
точках навчальної послідовності в середньому після 30 - 50 ітерацій середня абсолютна 
похибка на точках контрольної послідовності змінюється стрибкоподібно. 
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Рисунок 3 - Графіки залежності середньої абсолютної похибки на контрольній 
послідовності від кількості ітерацій для різних значень середньої абсолютної 
похибки на навчальній послідовності 
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ЗТ 


Важливо помітити, що є сенс запам'ятовувати значення вагових коефіцієнтів, 
які відповідають мінімальним значенням цільової функції. Оскільки важливою скла- 
довою МАСР є випадкова зміна значень матриці вагових коефіцієнтів, то неможливо 
стовідсотково гарантувати збіжність такого методу. І навіть велика кількість ітерацій 
не завжди приводить до бажаного результату. Запам'ятовування оптимальних значень 
вагових коефіцієнтів дозволить відновити функціонування НМ із точнішою іденти- 
фікацією шуканої залежності. 


Висновки 


Як відомо, суб'єктивні переваги людини, особливо при виборі 1 купівлі нерухо- 
мості, мають значну кількість «локальних екстремумів». Так, якщо покупця влаштовує 
загальна площа квартири, то він може не звернути уваги на її недоліки, хоча міг би 
вибрати 1 більш збалансований варіант. Проблеми такого роду і допоможе вирішити 
НМ із модифікованим алгоритмом стохастичної релаксації. Знаходження оптимального 
варіанта і визначення реальної ціни - задачі, які така НМ допомагає розв'язувати 
якнайкраще. 

Запропонований метод ідентифікації функції оцінки ОН впроваджено в інфор- 
маційно-аналітичній системі «ВЕМА », яка дозволяє здійснювати аналіз тенденцій, 
що складаються на ринку, прогнозувати динаміку зміни ціни ОН. Як показують от- 
римані результати, використання розробленого методу дозволить розв'язувати задачу 
визначення функції оцінки об'єктів нерухомості з більш високою ефективністю. 
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В.А. Тазетдинов 

Идентификация функции оценки обьекта недвижимости нейронной сетью 

В статье изложеньт аспектьт определения ценьт обьекта недвижимости с использованиєм модифицированного 
алгоритма стохастической релаксации. Предложенньй метод идентификации оценки обьекта недвижимости 
внедрен в информационно-аналитическую систему «ВЕМА». Вьшолнена верификация полученньх 
результатов с использованием искусственньх нейронньтх сетей. 
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Ідепіійсабіоп ої Со5і Кипсбїоп ої Кеа! Езгате Обіесі у Хеигаї Хеї 

Тре авресів ої декегпаїпайтоп ої собі ої геа! езіаїе обіесів мії п5аєе ої (шіогіпе 5їоспазбіс геіахайоп плодійей 
аїсогіїрт Бауе Бесп деусїорей. ТВі8 плеїод ої ідепіїйсайоп ої собі об геа! езіате обіесі Ба8 Бееп іпігодисей іп 
іпогтайоп апаїупса! зузієт «ВЕМА». Тре уегійсашоп ої обіаїпеай гезиіїв уіб. пзаєе ої пеига! агіїйсіа! 
пеї5 раз Бееп ассотаріїзпед. 
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